李彦宏为10人“心流”团队颁发700万大奖 表彰AI多模态技术新突破
在百度近日举办的技术颁奖典礼上,创始人李彦宏亲自为"心流"团队颁发"百度最高奖",奖金高达100万美元(约合人民币700余万元)。这支不超过10人的技术团队凭借在AI多模态领域的突破性成果,成为今年该奖项的唯一获得者。
在百度近日举办的技术颁奖典礼上,创始人李彦宏亲自为"心流"团队颁发"百度最高奖",奖金高达100万美元(约合人民币700余万元)。这支不超过10人的技术团队凭借在AI多模态领域的突破性成果,成为今年该奖项的唯一获得者。
传统 LLM 对话系统仅依赖文本交互,而多模态学习能融合文本、图像、语音、视频等多种信息,让对话突破 “纯文字” 限制 —— 比如用户发送一张 “猫咪呕吐” 的照片并提问 “它怎么了”,系统能结合图像特征与文本问题,给出更精准的宠物健康建议。这种技术让 LLM
9月8日,百度创始人李彦宏亲自为公司技术团队颁发“百度最高奖”,奖金高达100万美元,折合人民币超700万元。这个奖项颁给了“心流”团队,以表彰其在AI多模态技术上的突破。
在医学领域,有一种神奇的设备,如同给医生装上了 “透视眼”,能深入人体内部,发现那些常规影像无法发现的健康危机,它就是多模态分子影像设备。上海联影医疗科技股份有限公司(以下简称联影医疗)在这一领域取得了令人瞩目的成果,其研发的世界首台2米Total-body
刷到一条吐槽:“做了三年广告片,竟然被实习生用一句提示词打了样。
近日,优必选自主研发的人形机器人Walker最强大脑——百亿参数基座的多模态大模型:优必选Thinker,在机器人感知与规划领域三大国际权威基准测试——分别由微软、谷歌等发起与提出的MS COCO Detection Challenge、RoboVQA与Ego
多模态大模型(MLLM)在高层次视觉理解与推理任务上展现出惊艳能力。然而,如果你仔细观察,就会发现一个的事实:它们在一些看似简单、直观、人类幼儿都能轻松完成的任务中,却频频「翻车」。
在数字营销领域,随着生成式引擎优化(GEO, Generative Engine Optimization)的兴起,AI 搜索引擎算法的频繁更新确实是网站运营者和内容创作者面临的持续挑战。GEO 专注于通过生成式 AI 引擎(如 DeepSeek、豆包和元宝等
丘钛科技(01478)8月摄像头模组销售数量合计4707.9万件,环比增长18.4%,同比增长44.3%
在人工智能研究领域,一项重要的合作研究成果近期引起了广泛关注。这项名为"CORA: Adapting CLIP for Open-Vocabulary Detection with Region Prompting and Anchor Pre-Matchin
2025 年,人工智能的发展已进入深水区。当我们习惯于 AI 在各个领域的出色表现时,一些看似微小却关键的“瑕疵”,成为了衡量其真实智能水平的试金石。其中一个典型案例,便是 AI 模型在面对一张有六根手指的手掌图片时,普遍会将其识别为“五根手指”。
四川大学华西医院神经外科发表于《NPJ Precis Oncol》(中科院1区、IF=8.0分)的研究。研究针对脑膜瘤Ki-67指数预测的临床难题,提出了一种基于多模态深度学习模型的非侵入性解决方案。通过整合3D MRI、放射学特征与放射组学数据,该模型在内部
多模态大模型(MLLM)在高层次视觉理解与推理任务上展现出惊艳能力。然而,如果你仔细观察,就会发现一个的事实:它们在一些看似简单、直观、人类幼儿都能轻松完成的任务中,却频频「翻车」。
本次“9·3大阅兵”一次性亮出近 20 年来最密集的“高科技武器库”,既有“看得见”的隐身战机与高超音速武器,也有“看不见”的激光、量子干扰和太空战系统,被大家称为一场面向未来战争形态的“全维度科技秀”。
9月4日,字节Seed发布了原生GUI智能体UI-tars-2,其可以自主操作电脑、手机完成搜索、创建网页、搜集新闻、创建查询工具、玩小游戏等诸多任务,相关论文在9月2日发表于arXiv预印本平台。
近日,2025 元宇宙 AI 数据要素 “金杏奖” 决赛进入冲刺阶段,14 个历经多轮筛选的优秀项目将在最终环节展开角逐。据赛事组委会披露,本届大赛自启动以来共收到 289 个项目申报,经程序审查后 260 个项目获得正式参赛资格,程序审查淘汰率约 10.03
随着大模型技术的发展,对话式分析正引领一场效率革命,在各行业快速普及。未来,多模态技术将进一步重塑分析体验,成为企业数字化转型的标配能力。产品经理应把握这一趋势,避免技术崇拜,注重用户需求,为全员打造易用的数据洞察生产力工具。
本系列工作核心作者: 郭海洋(自动化所博士生)、 朱飞 (中科院香港院AI中心AP)、 曾繁虎 (自动化所硕士生)、 刘文卓 (自动化所博士生)、 赵宏博 (自动化所博士生)。通讯作者为自动化所博士生导师张煦尧研究员和刘成林研究员。团队长期从事人工智能研究,成
9月5日晚,阿里巴巴通义千问首个参数量超1万亿的大模型Qwen3-Max-Preview上线。阿里称其为通义千问系列中最强大的语言模型,在中英文理解、复杂指令遵循、工具调用等方面能力显著增强,大幅减少知识幻觉。在知识推理、数学推理、竞争性编程、复杂问题解决和人
随着AI能力进步,越来越多的传统硬件厂商以及基于小模型AI能力构建的智能硬件厂商,迫切得需要升级到大模型以提升交互体验。然而,对于众多企业来说要想保障低延时交互的同时,又要确保模型的效果并且引入外部服务丰富AI能力,还要兼顾成本就变得尤为挑战。